其他
详解自然语言处理5大语义分析技术及14类应用(建议收藏)
导读:自然语言处理(Natural Language Processing,NLP)技术是与自然语言的计算机处理有关的所有技术的统称,其目的是使计算机能够理解和接受人类用自然语言输入的指令,完成从一种语言到另一种语言的翻译功能。
自然语言处理技术的研究,可以丰富计算机知识处理的研究内容,推动人工智能技术的发展。
内容选择:决定要表达哪些内容。 句子规划:决定篇章及句子的结构,进行句子的融合、指代表述等。 表层实现:决定选择什么样的词汇来实现一个句子的表达。
字词级别的分析主要包括中文分词、命名实体识别、词性标注、同义词分词、字词向量等; 句法级别的分析主要包括依存文法分析、词位置分析、语义归一化、文本纠错等; 篇章级别的分析主要包括标签提取、文档相似度分析、主题模型分析、文档分类和聚类等。
one-hot是指向量中只有一个维度的值为1,其余维度为0,这个维度代表了当前词。 分布式表示(word embedding)指的是将词转化为一种分布式表示,又称词向量,分布式表示将词表示成一个定长的稠密向量。
可读性指的是其本身作为一个词语或者短语就应该是有意义的; 相关性指的是标签必须与文档的主题、内容紧密相关; 覆盖度指的是文档的标签能较好地覆盖文档的内容,而不能只集中在某一句话中。
基于字符串的方法是指从字符串的匹配度出发,以字符串共现和重复程度为相似度的衡量标准; 基于语料库的方法是指利用从语料库中获取的信息计算文本的相似度; 基于知识的方法是指利用具有规范组织体系的知识库计算文本的相似度。
关于作者:达观数据,中国智能RPA领域的龙头企业,独立开发了全套“RPA+AI”系统,拥有核心知识产权。达观智能RPA产品是业界不依赖微软底层开发框架、未使用第三方开源框架的RPA产品。
本文摘编自《智能RPA实战》,经出版方授权发布。
转载请联系微信:DoctorData
推荐语:这是一部从实战角度讲解“AI+RPA”如何为企业数字化转型赋能的著作,从基础知识、平台构成、相关技术、建设指南、项目实施、落地方法论、案例分析、发展趋势8个维度对智能RPA做了系统解读,为企业认知和实践智能RPA提供全面指导。
更多精彩👇